Java虚拟机的内部体系结构

在 Java虚拟机规范中,一个虚拟机实例的行为是分别按照子系统、内存区、数据类型和指令来描述的,
这些组成部分一起展示了抽象的虚拟机内部体系结构。

image

运行时数据区

Java虚拟机在执行Java程序的时候会把它管理的内存划分为若干个不同的数据区域,这些区域有各自的用途以及创建
和销毁的时机,有的区域随着虚拟机进程的启动而存在(线程共享),有的区域则随着用户线程的启动和结束而建立
和销毁(线程私有)。Java虚拟机所管理的内存包括以下几个运行时数据区域:

程序计数器

对于一个运行中的Java程序而言,每一个线程都有它的程序计数器,也叫PC寄存器,可以看做当前线程所执行的字节
码的行号指示器。在虚拟机的概念模型里,字节码解释器就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,
分支,循环,跳转,异常处理,线程恢复等都需要依赖这个计数器。

程序计数器既能持有一个本地指针,也能持有一个returnAddress。当线程执行某个Java方法时,程序计数器的值总是
下一条被执行指令的地址。这里的地址可以是一个本地指针,也可以是方法字节码中相对该方法起始指令的偏移量。
如果该线程正在执行一个本地方法,那么此时程序计数器的值是“undefined”。
程序计数器属于线程私有的内存,也就是说,每当创建一个线程,都将得到该线程自己的一个程序计数器。
Java虚拟机的多线程是通过线程的轮换并且分配处理器的执行时间来实现的,在一个确定的时刻,一个处理器都只会执行一条
线程中的指令。

为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器。

Java虚拟机栈(Java栈)

Java虚拟机栈也是线程私有的,它的生命周期和线程相同。Java虚拟机栈描述的是Java方法执行的内存模型,每个方法在执行时会创建一个栈帧,用于存放局部变量表,操作数栈,动态链接,方法出口等信息。一个Java方法从调用到执行结束的过程,相当于一个栈帧在Java虚拟机栈中从入栈到出栈的过程。

局部变量表

局部变量表用于存放编译时期可知的各种基本数据类型,对象的引用(不等同于对象,可能是指向对象的起始地址的指针,也可
能是指向一个代表对象的句柄)以及returnAddress类型(指向了一条字节码地址)。局部变量在方法执行时被创建,
在方法执行结束时销毁。字节码指令通过从0开始的索引使用其中的数据。类型为int, float, reference和returnAddress的值
在数组中占据一项,而类型为byte, short和char的值在存入数组前都被转换为int值,也占据一项。但类型为long和double的值
在数组中却占据连续的两项。

操作数栈

和局部变量区一样,操作数栈也是被组织成一个以字长为单位的数组。它通过标准的栈操作访问–压栈和出栈。由于程序计数器
无法被程序指令直接访问,Java虚拟机的指令是从操作数栈中取得操作数,所以它的运行方式是基于栈而不是基于寄存器。
虚拟机把操作数栈作为它的工作区,因为大多数指令都要从这里弹出数据,执行运算,然后把结果压回操作数栈。

帧数据区

除了局部变量区和操作数栈,Java栈帧还需要帧数据区来支持常量池解析、正常方法返回以及异常派发机制。
每当虚拟机要执行某个需要用到常量池数据的指令时,它会通过帧数据区中指向常量池的指针来访问它。除了常量池的解析外,
帧数据区还要帮助虚拟机处理Java方法的正常结束或异常中止。如果通过return正常结束,虚拟机必须恢复发起调用的方法的
栈帧,包括设置程序计数器指向发起调用方法的下一个指令;如果方法有返回值,虚拟机需要将它压入到发起调用的方法的操作数栈。
为了处理Java方法执行期间的异常退出情况,帧数据区还保存一个对此方法异常表的引用。

本地方法栈

任何本地方法接口都会使用某种本地方法栈,本地方法栈与Java虚拟机栈发挥的作用类似。当线程调用Java方法时,
虚拟机会创建一个新的栈帧并压入Java栈。当它调用的是本地方法时,虚拟机会保持Java栈不变,不再在线程的Java栈中压入新
的栈,虚拟机只是简单地动态连接并直接调用指定的本地方法。

堆(Heap)

Java程序在运行时创建的所有类实例或数组(数组在Java虚拟机中是一个真正的对象)都放在同一个堆中,堆是虚拟机管理的
内存最大的一块,被所有线程所共享,在虚拟机启动的时候创建。堆内存的唯一目的就是存放对象实例,几乎所有的对象实例
都在堆中分配内存。(大对象)

方法区(Method Area)

方法区同Java堆一样,是各个线程共享的内存区域,用于存储已经被虚拟机加载的类信息,常量,静态变量以及
及时编译器(JIT)编译后的代码等信息。

当虚拟机装载某个类型时,它使用类装载器定位相应的class文件,然后读入这个class文件并将它传输到虚拟机中,接着虚拟机
提取其中的类型信息,并将这些信息存储到方法区。方法区也可以被垃圾回收器收集,因为虚拟机允许通过用户定义的类装载器
来动态扩展Java程序。

方法区中存放了以下信息:

• 这个类型的全限定名(如全限定名java.lang.Object)
• 这个类型的直接超类的全限定名
• 这个类型是类类型还是接口类型
• 这个类型的访问修饰符(public, abstract, final的某个子集)
• 任何直接超接口的全限定名的有序列表
• 该类型的常量池,Class文件中除了有类的版本,字段,方法,接口等描述信息外,还有一项是常量池,用于存放编译时生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放
• 字段信息(字段名、类型、修饰符)
• 方法信息(方法名、返回类型、参数数量和类型、修饰符)
• 除了常量以外的所有类(静态)变量
• 指向ClassLoader类的引用(每个类型被装载时,虚拟机必须跟踪它是由启动类装载器还是由用户自定义类装载器装载的)
• 指向Class类的引用(对于每一个被装载的类型,虚拟机相应地为它创建一个java.lang.Class类的实例存于堆中。比如你有一个到java.lang.Integer类的对象的引用,那么只需要调用Integer对象引用的getClass()方法,就可以得到表示java.lang.Integer类的Class对象)

类加载子系统

虚拟机把Java描述类的信息加载到内存,并对数据进行校验,转换解析和初始化,形成可以被Java虚拟机直接使用的Java类型,这就是Java虚拟机的类加载机制。类从加载到虚拟机开始,到卸载出内存为止,它的整个生命周期包括:

加载,验证,准备,解析,初始化,使用和卸载7个阶段。

image

加载

加载是类加载的一个阶段,在该阶段,Java虚拟机主要完成以下三件事情:

• 根据此类的全限定名来确定该类的二进制字节流;
• 将这个字节流所代表的静态数据存储结构转换为方法区的运行时数据结构;
• 在堆内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口。

验证

验证是连接的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息是否符合该虚拟机的要求。

准备

准备阶段正式为类变量在方法区中分配内存并且赋初始值,初始值一般为该类变量类型的零值。

解析

解析阶段虚拟机将常量池内的符号引用替换为直接引用。
符号引用:以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义的定位到目标即可。
直接引用:是指能直接指向目标的指针,相对偏移量或是一个能间接定位到目标的句柄。

初始化

初始化是类加载过程的最后一个阶段,在前面的类加载过程中,除了在加载阶段用户可以自定义类加载器参与之外,其余动作完全由虚拟机主导和控制,到了初始化阶段,才真正开始执行类中定义的Java代码(字节码)。准备阶段为类变量分配内存并且赋初始值,赋值操作在初始化阶段执行。